XX. mendeko Euskararen Corpus estatistikoa

Testuingurua

INFORMATIKA ETA EUSKARA

Gure taldearen erronka joera berri hauetara euskara egokitzea da.

Helburu horrek ia hutsetik hasi beharra ekartzen du batetik eta, euskararen berezitasunak direla eta, zenbait problema desberdini aurre egin beharra bestetik.

Gauzak horrela, azpiegitura sendo bat eratzen saiatu gara.

Emaitza edo produktu ikusgarrietara jotzea baino nahiago izan dugu ezari-ezarian hasi eta norabide egokian pausoak ematea.

Aipatu azpiegiturak bi zutabe ditu: oinarrizko datu-base lexikala eta testuz nahiz hiztegiz osatutako korpusa.

Biltegi horiek laguntza paregabea ematen dute euskararen izaera aztertzeko, izan ere, halako azterketarik gabe prozesamendu automatikoa herren geratzen baita.

Euskarria osatzeko analizatzaile/sortzaile morfologiko eta sintaktikoak beharrezkoak dira.

Morfologia landu zen aurrena, sintaxiarekin dihardugu egun eta semantika dugu gure asmoen artean.

EUSKARARAKO APLIKAZIOAK

Ingurune honen barruan garatutako eta garatzen ari garen proiektuen aurkezpentxoa da ondoko lerroetan dakarguna, axalekoa bada ere.

0. HAIN: Hizkuntz Aplikazioetarako INgurunea

Proiektu honen helburua hizkuntz aplikazioetarako ingurune informatiko bat lortzea da, alegia, xede desberdinetarako hizkuntz tresnaz osaturiko multzo bat era integratu batez biltzea.

Ingurune honek irekia izan nahi du eta edozein erabiltzailerentzat eskura egon, modu atseginez kontsultatu ahal izateko.

Ondoren aurkeztuko ditugun moduluek osatzen dute aipatu ingurunea:

1. EDBL (Euskararako Datu-Base Lexikala)

EDBL, lexikoari buruzko informazio-biltegi erraldoia den neurrian, helburu askotarako erabilgarria izan daiteke [Agirre eta beste 94a].

Gure interesa, oraingoz, euskararen tratamendu automatikoari dagokiona da.

Beraz, EDBL euskararen prozesamendu automatikoan zeregin desberdin askotarako oinarri lexikala da, hau da, arloko lan desberdinetan beharrezko diren lexikoien oinarri eta iturri.

50.000 sarreratik gora ditu datu-baseak, bakoitza bere kategoria eta informazio morfologikoarekin.

Funtzioari buruzko hainbat informazio ere gehitu da, sintaxia eta semantikarako bidea irekiz.

Hiztegi moderno eta zabala da, euskara batua oinarrian duena eta Euskaltzaindiaren erabaki/gomendioekin batera eguneratzen dena.